بازشناسی گوینده مبتنی بر روشهای ادغام اطلاعات در سطح تصمیم

thesis
abstract

در میان تمام فناوریها و روشهای تشخیص هویت زیستی، بازشناسی گوینده بر مبنای اطلاعات صحبت را میتوان طبیعیترین و اقتصادیترین روش برای سیستمهای ارتباط انسان-ماشین دانست. همچنین توسعه فناوری پردازش صحبت باعث تقویت بسیاری از کاربردهای بازشناسی گوینده شده است. از آنجا که یکی از مهمترین زمینههای تحقیقاتی فعال که در سالهای اخیر در بسیاری از کاربردها باعث بهبود عمده در بازشناسی گوینده شده است استفاده از روشها و مدلهای ادغام اطلاعات در سطوح مختلف میباشد محور اصلی در این پژوهش، بهبود دقت بازشناسی گوینده با استفاده از ادغام اطلاعات در سطح تصمیم است. در این پایان نامه رویکرد استخراج ویژگیهای جدیدی بر پایه ضرایب کپسترال جهت فراهم سازی منابع تصمیم گیری مورد استفاده در ادغام تصمیم مد نظر قرار گرفته و با توجه به اینکه مشتقات هر تابع بخشی از ویژگیهای مستتر در آن را به نمایش میگذارد از مشتق اول و دوم ضرایب کپسترال مل-فرکانس به عنوان بردارهای ویژگی ثانویه استفاده نموده ایم. این رویکرد به مفهوم استفاده و بهرهگیری همزمان از اطلاعات نهفته در بردار ویژگی، تغییرات(بردار سرعت) و نرخ تغییرات(بردار شتاب) ویژگی میباشد. پس از بازشناسی گوینده مبتنی بر این سه بردار ویژگی به صورت مجزا، جهت بهبود دقت و صحت نتایج بازشناسی و شناسایی، اقدام به طراحی چارچوب ادغام اطلاعات در سطح تصمیم نمودهایم. استفاده همزمان از این بردارهای ویژگی در بستر ادغام تصمیم تاکنون توسط محققان گزارش نشده است. استفاده از روشهای مناسب جهت خوشه بندی بردارهای ویژگی از جمله روش کوانتیزه کردن برداری و همچنین توابع تعیین اندازه شباهت از جمله فاصله ماهالانوبیس و فاصله حداکثر شباهت مبتنی بر حد آستانه از دیگر کارهای مهم انجام شده در پژوهش می باشد. در مرحله ادغام تصمیم، نتایج بازشناسیهای اولیه را با استفاده از روشهای ادغام تصمیم از جمله روشهای رأیگیری، رتبه بندی و روش امتیازدهی ترکیب و نتیجه را به عنوان بازشناسی نهایی استفاده ایم. نتایج نشان دهد که روشهای ادغام تصمیم باعث بهبود قابل توجه در دقت بازشناسی گوینده نسبت به حالت بدون ادغام شود. از نتایج دیگر این است که استفاده همزمان از اطلاعات مستتر در بردارهای تغییرات ضرایب کپسترال و بردارهای نرخ این تغییرات برای بازشناسی گوینده باعث بهبود کارایی سیستم بازشناسی گوینده میشود.

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

تطبیق گوینده در بازشناسی گفتار پیوسته براساس تخمین map مبتنی بر تبدیل mllr

روشهای مختلفی برای تطبیق گوینده در سیستمهای بازشناسی گفتار معرفی گردیده اند. در برخی روشها نظیر تخمین map تنها مدلهایی که داده آموزشی متناظرشان موجود باشد تازه سازی می شوند و برای بهبود قابل توجه دقت بازشناسی، داده آموزشی نسبتاً زیادی مورد نیاز است. در برخی دیگر نظیر mllr که تعدادی تبدیلات عمومی بر روی خوشه های مدلها اعمال می شود، برای دادگان کم آموزشی نتایج مطلوبی حاصل می شود، اما با افزایش داد...

full text

بهبود نرخ بازشناسی ارقام دست نویس فارسی با استفاده از روش های ادغام در سطح تصمیم

هدف یک سیستم بازشناسی الگو قراردادن الگوها با کمتـرین خطـا، در کـ?س مربـوط بـه خودشـان اسـت. بازشناسی ارقام دستنویس فارسی یکی از مسائل مهم در حوزه بازشناسی الگو می-باشد. تحقیقات در این زمینه چندین دهه است که آغاز شده است و هنوز هم در حال پیشرفت می-باشد. در?سیستم های معمولی بازشناسی الگو از یـک طبقـه بنـد اسـتفاده مـی شـود کـه ?زمـه آن، بکـارگیری یـک مـدل? طبقه بندی پیچیده یا استفاده از ویژگی ها...

15 صفحه اول

بررسی روش های طیف سنجی همکارانه مبتنی بر ادغام اطلاعات-تصمیم در رادیوی شناختگر

افزایش روز افزون نیاز به منابع طیفی همزمان با رشد روز افزون تکنولوژی و با توجه به محدودیت دسترسی به طیف و موثر نبودن سیاست های فعلی تخصیص طیف نیاز به تکنولوژی ای را که بتواند بصورت فرصت طلبانه از منابع طیفی استفاده کند، تشدید می کند. رادیوی شناختگر بعنوان یک تکنولوژی جدید بمنظور استفاده بهینه از طیف برای اولین بار در سال 1999 توسط میتلا معرفی شد. ایده اصلی در رادیوی شناختگرتمهید اشتراک منابع و ...

رتبه‌بندی واج‌های گفتار فارسی از نظر کارآیی در بازشناسی گوینده

در این مقاله، کارآیی واج­های گفتار فارسی از نظر بازشناسی گوینده مورد مطالعه و پژوهش قرار گرفته و با توجه به میزان کارآیی­ها، رتبه­بندی واج­ها صورت گرفته‌اند. جهت برآورد کارآیی واج­ها، از یک معیاری که به­صورت نسب « فاصلة بین­گوینده­ای» واج­ها به « فاصلة در گوینده‌ای» تعریف شده است و ما آن را « نسبت تأثیرپذیری گوینده » نامیده­ایم، استفاده شده است.­ آزمایش­ها و محاسبات لازم برای کلیه واج­های گفتار...

full text

طبقه بندی راه های شهری مبتنی بر ادغام در سطح تصمیمات داده های نوری و راداری

در این مقاله قابلیت تصاویر اسپات و سار به منظور تشخیص عارضه راه در مناطق شهری مورد بررسی قرار گرفته است. شباهت طیفی عارضه راه با سقف آسفالت ساختمان ها در مناطق شهری موجب بروز مشکلاتی در تشخیص راه مبتنی بر داده های اپتیک از جمله اسپات می گردد. از سوی دیگر، تصاویر سار با اینکه قابلیت خوبی در تشخیص راههای فرعی و باریک دارند، اما در تشخیص راه از پوشش گیاهی دچار مشکلاتی می شود. بنابراین، نتایج حاصل ...

full text

بازشناسی گوینده وابسته به متن

دراین تحقیق طراحی و بکارگیری سیستمهای بازشناسی گوینده ارائه شده است. بازشناسی گوینده، استفاده از یک ماشین جهت بازشناسی یک شخص از یک عبارت بیان شده است. این سیستمها می توانند به دو روش عمل کنند : شناسایی یک شخص بخصوص یا تآیید ادعای شخص مدعی، شناسایی یک شخص با استفاده از ویژگیهای فیزیکی از قبیل گفتار، نمونه ای از اهمیت تجاری در زمینه امنیتی است. بازشناسی گفتار یک روش شناسایی شخص، مبتنی بر استخراج...

15 صفحه اول

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

سایر - دانشکده صدا و سیمای جمهوری اسلامی ایران

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023